SPSS详细操作:配对卡方检验(McNemar’s test)
一、问题与数据
某研究者想要观察戒烟干预的效果,招募了50名研究对象,其中吸烟者和不吸烟者各25名。所有研究对象均观看吸烟导致癌症的视频。两周后,研究者询问研究对象是否还在吸烟。
研究者收集了所有研究对象的干预前吸烟状态(before)和干预后吸烟状态(after)。两个变量均为二分类变量,即不吸烟与吸烟(分别赋值为1和2),部分数据如下图。
其中,Individual scores for each paticipant列出了每一个研究对象的情况,而Total count data (frequencies)则是对相同情况研究对象的数据进行了汇总。
二、对问题的分析
研究者想了解同一人群干预前后的吸烟状态,且吸烟状态为二分类变量。针对这种情况,可以使用McNemar’s检验,但需要先满足2项假设。
假设1:变量为二分类,且两类之间互斥。
假设2:所有研究对象均有前后两次测量数据。
这2项假设均与研究设计和数据类型有关。
三、SPSS操作
1. 数据加权
如果数据是汇总格式(如上图中的Total count data),则在进行卡方检验之前,需要先对数据加权。如果数据是个案格式(如上图中的Individual scores for each paticipant),则可以跳过“数据加权”步骤,直接进行SPSS操作。
数据加权的步骤如下:
在主界面点击Data→Weight Cases,弹出Weight Cases对话框后,点击Weight cases by,激活Frequency Variable窗口。将freq变量放入Frequency Variable栏,点击OK。
2. McNemar’s检验
在主界面点击Analyze→Nonparametric Tests→Related Samples。出现Nonparametric Tests:Two or More Related Samples对话框。确认在What is your objective?区域勾选了Automatically compare observed data to hypothesized。
点击Fields,将变量Before和After选入Test Fields:框。(如果使用的数据是Total count data的形式,则Fields中还有变量freq,但其余操作都相同)。
点击Settings,选择Customize tests并勾选Test for Change in Binary Data区域的McNemar’s test (2 samples),点击Run。
四、结果解释
1. 统计描述
McNemar’s检验的最终检验结果如下图:
双击Hypothesis Test Summary,启动Model Viewer窗口。
右侧出现Related-Samples McNemar Change Test,下方的表则包含多个统计量,首先查看Related-Samples McNemar Change Test。
研究者可以观察到只有条形图的格子,没有观测数和期望数,将鼠标移到条形图区域即可显示观测数和期望数。
报告McNemar检验结果前,研究者需要了解数据才能更好地解读。其中最重要的就是分别汇报干预前吸烟者在干预后继续吸烟和戒烟的比例。研究者在进行McNemar检验前可以计算这些比例,也可以利用Related-Samples McNemar Change Test计算。
50例研究对象中25例为不吸烟者,即干预前不吸烟者的比例为50% (25 ÷ 50 = 50%)。干预后,50例研究对象中有36例不吸烟,因此不吸烟者的比例上升至72% (36 ÷ 50 = 72%)。除此之外,还应该报告干预前后吸烟状态发生改变的研究对象。
该图的左下角格子表示,有16例研究对象干预前吸烟,干预后戒烟。右上角格子表示, 5例研究对象干预前不吸烟,干预后开始吸烟。
因此,研究者应该汇报:本研究招募了50例研究对象参与有关戒烟的干预试验,其中吸烟者和不吸烟者各占50%。干预后,不吸烟者比例增加到72%,吸烟者比例降低至28%。16例吸烟者在干预后戒烟,另有5例不吸烟者在干预后开始吸烟。
2. McNemar检验结果
将前述的“Model Viewer”中的检验结果,整理后如下图:
Hypothesis Test Summary表的注释1说明了根据二项式分布用精确法得到P值。可以看到,Hypothesis Test Summary表“Sig.”一列的值,与右侧表中的“Exact Sig. (2-sided test)”的值相等。
McNemar检验的P值可以根据二项分布得出精确P值,也可通过卡方分布(自由度为1)得出近似P值。如果图中左下和右上背景标黄的格子中研究对象总数小于等于25时,采用精确法计算。
从上图中可以看到两个格子相加的观测数为21(16+5=21),小于25,因此本例中根据二项分布计算精确P值。
输出结果的表格中,“Exact Sig. (2-sided test)”一行的P值为0.027,“Asymptotic Sig. (2-sided test)”一行的近似P值为0.029。(如果左下和右上格子相加的观测数大于25,不展示精确P值,只展示近似P值,此时Hypothesis Test Summary表中结果也是近似P值)。
不管SPSS给出精确P值还是近似P值,判断假设检验的方法仍然相同。如果P值小于0.05,McNemar检验有统计学意义,即干预前和干预后不吸烟者的比例有统计学差异。
五、撰写结论
如果得到的是根据二项分布计算McNemar检验的精确P值(即本例中的情况),则汇报:
本研究招募了50例研究对象参与有关戒烟的干预试验,其中吸烟者和不吸烟者各占50%。干预后,不吸烟者比例增加到72%(36例),吸烟者比例降低至28%(14例)。16例吸烟者在干预后戒烟,另有5例不吸烟者在干预后开始吸烟。采用McNemar精确检验发现,干预前后不吸烟者比例的差异有统计学意义,P=0.027。
如果得到的是根据卡方分布计算McNemar检验的近似P值(非本例情况),则汇报:
本研究招募了50例研究对象参与有关戒烟的干预试验,其中吸烟者和不吸烟者各占50%。干预后,不吸烟者比例增加到72%(36例),吸烟者比例降低至28%(14例)。16例吸烟者在干预后戒烟,另有5例不吸烟者在干预后开始吸烟。采用校正卡方检验发现,干预前后不吸烟者比例的差异有统计学意义,P=0.027。
更多阅读
关注医咖会,轻松学习统计学~
快加小咖个人微信(xys2016ykf),拉你进统计讨论群和众多热爱研究的小伙伴们一起交流学习。如果想进群,添加小咖时请注明“加群”二字。
点击左下角“阅读原文”,看看医咖会既往推送了哪些统计教程。